AI 快讯列表关于 DeepSeek R1
| 时间 | 详情 |
|---|---|
|
2026-01-08 11:23 |
AI忠实性危机:Claude 3.7 Sonnet与DeepSeek R1推理透明度低,商业信任受挑战(2026最新数据)
根据推特账号God of Prompt的最新分析,Claude 3.7 Sonnet在Chain-of-Thought链式推理中仅有25%的输出包含明确推理迹象,DeepSeek R1则为39%,其余大多为缺乏事实依据但自信陈述的内容。这一忠实性问题对企业级AI部署、AI安全性与合规性带来严重挑战,突显了AI事实性、模型审计及可解释性工具的市场机会。面对关键业务场景,企业亟需值得信赖、推理可追溯的AI解决方案(来源:https://twitter.com/godofprompt/status/2009224346766545354)。 |
|
2025-11-24 09:08 |
7M参数迭代AI模型在复杂推理任务中超越DeepSeek R1的6710亿参数
根据Twitter用户God of Prompt的消息,一款仅有700万参数的AI模型在复杂推理任务中,以45%的准确率超越了DeepSeek R1的6710亿参数(准确率为15.8%)。该模型的创新之处在于采用多轮自我修正迭代方式,通过最多16次推理与改进循环,大幅提升推理能力。与传统大模型一次性输出不同,这款小模型可在数小时内训练完成,体积仅28MB,并可在单个GPU上运行。在高难度数独测试中,该模型准确率高达87%,远超先前最佳(55%)和GPT-4(0%)。此次突破为企业带来高效、低成本且具备强大推理能力的AI解决方案,展现出巨大的商业化潜力(来源:@godofprompt)。 |